
GeminiAPI可使用原生文字轉語音(TTS)生成功能,將文字輸入內容轉換為單人或多人語音音訊。文字轉語音(TTS)生成功能可控,也就是說,你可以使用自然語言建構互動,並引導音訊的風格、口音、語速和語氣。,在本課程中,您將使用Speech-to-TextAPI將音訊檔案轉錄成文字...
Speech-to-Text API:語音辨識和語音轉錄
在本課程中,您將使用Speech-to-TextAPI將音訊檔案轉錄成文字檔案、使用GoogleCloudTranslationAPI翻譯,並使用NaturalLanguageAI建立合成語音。
** 本站引用參考文章部分資訊,基於少量部分引用原則,為了避免造成過多外部連結,保留參考來源資訊而不直接連結,也請見諒 **